دسترسی نامحدود
برای کاربرانی که ثبت نام کرده اند
برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید
در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید
برای کاربرانی که ثبت نام کرده اند
درصورت عدم همخوانی توضیحات با کتاب
از ساعت 7 صبح تا 10 شب
ویرایش: 2nd
نویسندگان: Alberto Boschetti. Luca Massaron
سری:
ISBN (شابک) : 9781786462138
ناشر: Packt
سال نشر: 2016
تعداد صفحات: 0
زبان: English
فرمت فایل : RAR (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود)
حجم فایل: 5 مگابایت
در صورت تبدیل فایل کتاب Python Data Science Essentials [source code] به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.
توجه داشته باشید کتاب Python Data Science Essentials [کد منبع] نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.
با درک مفاهیم کلیدی Python درباره این کتاب، به یک متخصص علوم داده کارآمد تبدیل شوید - با استفاده از Python 3.5 به سرعت با علم داده آشنا شوید - با تمام ابزارهای ضروری توضیح داده شده در زمان (و تلاش) صرفه جویی کنید - پروژه های علمی داده موثر ایجاد کنید و از دام های رایج با کمک استفاده نکنید. مثالها و نکات دیکتهشده توسط تجربه این کتاب برای چه کسی است اگر شما یک دانشمند داده مشتاق هستید و حداقل دانش کاری در مورد تجزیه و تحلیل دادهها و پایتون دارید، این کتاب شما را در علم داده شروع میکند. تحلیلگران داده با تجربه R یا MATLAB نیز این کتاب را مرجعی جامع برای تقویت مهارت های دستکاری داده و یادگیری ماشینی خود می دانند. آنچه یاد خواهید گرفت- جعبه ابزار علم داده خود را با استفاده از یک محیط علمی پایتون در ویندوز، مک، و لینوکس- داده ها را برای پروژه علم داده خود آماده کنید- داده ها را به منظور حل مشکلات علم داده دستکاری، اصلاح و کاوش کنید- یک خط لوله آزمایشی برای آزمایش فرضیه های علم داده خود راه اندازی کنید- موثرترین و مقیاس پذیرترین الگوریتم یادگیری را برای علم داده خود انتخاب کنید. وظایف - مدلهای یادگیری ماشین خود را بهینه کنید تا بهترین عملکرد را داشته باشید - نمودارهای خوشهای را کاوش کنید، از اتصالات و پیوندها در دادههای خود استفاده کنید. در علم داده با استفاده از پایتون بینش مدرنی از هسته دادههای پایتون، از جمله آخرین نسخههای نوتبوکهای Jupyter، NumPy، پانداها و scikit-learn دریافت کنید. با تجسم داده های زیبا با Seaborn و ggplot، توسعه وب با Bottle، و حتی مرزهای جدید یادگیری عمیق با Theano و TensorFlow، فراتر از اصول اولیه نگاه کنید. با استفاده از رویکرد تک منبعی که به شما امکان می دهد با پایتون 2.7 نیز کار کنید، به ساخت جعبه ابزار علوم داده ضروری پایتون 3.5 خود بپردازید. به سرعت با munging و پیش پردازش داده ها و تمام تکنیک هایی که برای بارگیری، تجزیه و تحلیل و پردازش داده های خود نیاز دارید، آشنا شوید. در نهایت، یک نمای کلی از الگوریتمهای اصلی یادگیری ماشین، تکنیکهای تجزیه و تحلیل گراف، و تمام ابزارهای تجسم و استقرار که ارائه نتایج خود را به مخاطبانی از متخصصان علوم داده و کاربران تجاری آسانتر میکنند، دریافت کنید. سبک و رویکرد این کتاب به این صورت است. یک پروژه علم داده شما همیشه از کدهای واضح و مثالهای سادهشده برای کمک به درک مکانیکهای اساسی و مجموعه دادههای دنیای واقعی بهرهمند خواهید شد.
Become an efficient data science practitioner by understanding Python's key conceptsAbout This Book- Quickly get familiar with data science using Python 3.5- Save time (and effort) with all the essential tools explained- Create effective data science projects and avoid common pitfalls with the help of examples and hints dictated by experienceWho This Book Is ForIf you are an aspiring data scientist and you have at least a working knowledge of data analysis and Python, this book will get you started in data science. Data analysts with experience of R or MATLAB will also find the book to be a comprehensive reference to enhance their data manipulation and machine learning skills.What You Will Learn- Set up your data science toolbox using a Python scientific environment on Windows, Mac, and Linux- Get data ready for your data science project- Manipulate, fix, and explore data in order to solve data science problems- Set up an experimental pipeline to test your data science hypotheses- Choose the most effective and scalable learning algorithm for your data science tasks- Optimize your machine learning models to get the best performance- Explore and cluster graphs, taking advantage of interconnections and links in your dataIn DetailFully expanded and upgraded, the second edition of Python Data Science Essentials takes you through all you need to know to suceed in data science using Python. Get modern insight into the core of Python data, including the latest versions of Jupyter notebooks, NumPy, pandas and scikit-learn. Look beyond the fundamentals with beautiful data visualizations with Seaborn and ggplot, web development with Bottle, and even the new frontiers of deep learning with Theano and TensorFlow. Dive into building your essential Python 3.5 data science toolbox, using a single-source approach that will allow to to work with Python 2.7 as well. Get to grips fast with data munging and preprocessing, and all the techniques you need to load, analyse, and process your data. Finally, get a complete overview of principal machine learning algorithms, graph analysis techniques, and all the visualization and deployment instruments that make it easier to present your results to an audience of both data science experts and business users.Style and approachThe book is structured as a data science project. You will always benefit from clear code and simplified examples to help you understand the underlying mechanics and real-world datasets.
Cover Copyright Credits About the Authors About the Reviewer www.PacktPub.com Table of Contents Preface Chapter 1: First Steps Introducing data science and Python Installing Python Python 2 or Python 3? Step-by-step installation The installation of packages Package upgrades Scientific distributions Anaconda Leveraging conda to install packages Enthought Canopy PythonXY WinPython Explaining virtual environments conda for managing environments A glance at the essential packages NumPy SciPy pandas Scikit-learn Jupyter Matplotlib Statsmodels Beautiful Soup NetworkX NLTK Gensim PyPy XGBoost Theano Keras Introducing Jupyter Fast installation and first test usage Jupyter magic commands How Jupyter Notebooks can help data scientists Alternatives to Jupyter Datasets and code used in the book Scikit-learn toy datasets The MLdata.org public repository LIBSVM data examples Loading data directly from CSV or text files Scikit-learn sample generators Summary Chapter 2: Data Munging The data science process Data loading and preprocessing with pandas Fast and easy data loading Dealing with problematic data Dealing with big datasets Accessing other data formats Data preprocessing Data selection Working with categorical and text data A special type of data – text Scraping the Web with Beautiful Soup Data processing with NumPy NumPy's n-dimensional array The basics of NumPy ndarray objects Creating NumPy arrays From lists to unidimensional arrays Controlling the memory size Heterogeneous lists From lists to multidimensional arrays Resizing arrays Arrays derived from NumPy functions Getting an array directly from a file Extracting data from pandas NumPy's fast operations and computations Matrix operations Slicing and indexing with NumPy arrays Stacking NumPy arrays Summary Chapter 3: The Data Pipeline Introducing EDA Building new features Dimensionality reduction The covariance matrix Principal Component Analysis (PCA) PCA for big data – RandomizedPCA Latent Factor Analysis (LFA) Linear Discriminant Analysis (LDA) Latent Semantical Analysis (LSA) Independent Component Analysis (ICA) Kernel PCA T-SNE Restricted Boltzmann Machine (RBM) The detection and treatment of outliers Univariate outlier detection EllipticEnvelope OneClassSVM Validation metrics Multilabel classification Binary classification Regression Testing and validating Cross-validation Using cross-validation iterators Sampling and bootstrapping Hyperparameter optimization Building custom scoring functions Reducing the grid search runtime Feature selection Selection based on feature variance Univariate selection Recursive elimination Stability and L1-based selection Wrapping everything in a pipeline Combining features together and chaining transformations Building custom transformation functions Summary Chapter 4: Machine Learning Preparing tools and datasets Linear and logistic regression Naive Bayes K-Nearest Neighbors Nonlinear algorithms SVM for classification SVM for regression Tuning SVM Ensemble strategies Pasting by random samples Bagging with weak classifiers Random subspaces and random patches Random Forests and Extra-Trees Estimating probabilities from an ensemble Sequences of models – AdaBoost Gradient tree boosting (GTB) XGBoost Dealing with big data Creating some big datasets as examples Scalability with volume Keeping up with velocity Dealing with variety An overview of Stochastic Gradient Descent (SGD) Approaching deep learning A peek at Natural Language Processing (NLP) Word tokenization Stemming Word tagging Named Entity Recognition (NER) Stopwords A complete data science example – text classification An overview of unsupervised learning Summary Chapter 5: Social Network Analysis Introduction to graph theory Graph algorithms Graph loading, dumping, and sampling Summary Chapter 6: Visualization, Insights, and Results Introducing the basics of matplotlib Curve plotting Using panels Scatterplots for relationships in data Histograms Bar graphs Image visualization Selected graphical examples with pandas Boxplots and histograms Scatterplots Parallel coordinates Wrapping up matplotlib's commands Introducing Seaborn Enhancing your EDA capabilities Interactive visualizations with Bokeh Advanced data-learning representations Learning curves Validation curves Feature importance for RandomForests GBT partial dependence plots Creating a prediction server for ML-AAS Summary Appendix: Strengthen Your Python Foundations Your learning list Lists Dictionaries Defining functions Classes, objects, and OOP Exceptions Iterators and generators Conditionals Comprehensions for lists and dictionaries Learn by watching, reading, and doing MOOCs PyCon and PyData Interactive Jupyter Don't be shy, take a real challenge Index